بسط پرس وجو به عنوان یکی از روش های انطباق پرس وجو، اثربخشی جستجو را در بازیابی اطلاعات افزایش می دهد. بازخورد شبه مرتبط (PRF) روشی برای بسط پرس وجو است که فرض می کند اسناد رتبه بالا از نتایج اولیه مرتبط به موضوع پرس وجو هستند و کلمات بسط را از این اسناد انتخاب می کند. درحالی که ممکن است اسناد نامرتبط به پرس وجو در اسناد رتبه بالا وجود داشته باشد. روش هایی برای انتخاب اسناد مرتبط و نادیده گرفتن اسناد خطا از اسناد رتبه بالا ارائه شده است که از خوشه بندی و یا طبقه بندی اسناد استفاده کرده اند. مهم ترین موضوع در بسط پرس وجو، انتخاب کلمات بسط از مرتبط-ترین اسناد است. در این مقاله ما خوشه بندی اسناد شبه بازخورد را بر اساس شباهت حساس به پرس وجو ارائه می کنیم که در قرار دادن شبیه ترین اسناد در کنار هم موثر است. شباهت حساس به پرس وجو که نسبت به شباهت مبتنی بر کلمه نتایج بهتری را در بازیابی اسناد بدست آورده است، دلیل استفاده در این مقاله است. خوشه ها را مطابق با شباهت درونی شان رتبه بندی کرده و تعدادی از خوشه های رتبه بالا را برای بسط انتخاب می کنیم. کلمات بسط را از اسناد خوشه های انتخاب شده، بر اساس تابع رتبه بندی TF-IDF استخراج می کنیم. آزمایش های انجام شده روی مجموعه داده پزشکی MED نشان می دهد که نتایج جستجو برای پرس وجوهای بسط داده شده با اسناد انتخاب شده از خوشه ها، نسبت به روش بازخورد شبه مرتبط (PRF) و بازیابی اولیه (VSM) بهتر است و اثربخشی جستجو را افزایش می دهد.